Model-based policy gradients: an empirical study on linear quadratic environments (2022)
Unidade: IMESubjects: APRENDIZADO COMPUTACIONAL, PROCESSOS ESTOCÁSTICOS
ABNT
LOVATTO, Ângelo Gregório. Model-based policy gradients: an empirical study on linear quadratic environments. 2022. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2022. Disponível em: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-28062022-123656/. Acesso em: 28 abr. 2024.APA
Lovatto, Â. G. (2022). Model-based policy gradients: an empirical study on linear quadratic environments (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/45/45134/tde-28062022-123656/NLM
Lovatto ÂG. Model-based policy gradients: an empirical study on linear quadratic environments [Internet]. 2022 ;[citado 2024 abr. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-28062022-123656/Vancouver
Lovatto ÂG. Model-based policy gradients: an empirical study on linear quadratic environments [Internet]. 2022 ;[citado 2024 abr. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-28062022-123656/